@InProceedings{SarmentoDutrErth:2012:ReCoDa,
author = "Sarmento, Peterson Lima and Dutra, Luciano Vieira and Erthal,
Guaraci Jos{\'e}",
affiliation = "{} and {Instituto Nacional de Pesquisas Espaciais (INPE)}",
title = "Redu{\c{c}}{\~a}o do conjunto de dados de treinamento para
melhorar a efici{\^e}ncia do classificador SVM",
booktitle = "Anais...",
year = "2012",
editor = "Castro, Ana Paula Abrantes de and Shiguemori, {\'E}lcio Hideiti
and Ramos, Fernando Manuel",
organization = "Workshop dos Cursos de Computa{\c{c}}{\~a}o Aplicada do INPE,
12. (WORCAP).",
publisher = "Instituto Nacional de Pesquisas Espaciais (INPE)",
address = "S{\~a}o Jos{\'e} dos Campos",
keywords = "Redu{\c{c}}{\~a}o de dados, SVM, KNN, Tempo, edi{\c{c}}{\~a}o,
edi{\c{c}}{\~a}o m{\'u}ltipla, condensa{\c{c}}{\~a}o.",
abstract = "O classificador M{\'a}quina de Vetores Suporte (Support Vector
Machine SVM), um classificador supervisionado que utiliza
basicamente os dados das classes pr{\'o}ximos {\`a} fronteira de
decis{\~a}o, {\'e} utilizado frequentemente devido ao seu bom
desempenho. Uma desvantagem deste m{\'e}todo {\'e} o aumento no
tempo de treinamento do classificador {\`a} medida que o tamanho
do conjunto de treinamento aumenta. A proposta deste trabalho
{\'e} aplicar t{\'e}cnicas de redu{\c{c}}{\~a}o do conjunto de
treinamento mantendo a acur{\'a}cia da classifica{\c{c}}{\~a}o.
As t{\'e}cnicas utilizadas ser{\~a}o edi{\c{c}}{\~a}o,
edi{\c{c}}{\~a}o m{\'u}ltipla, e condensa{\c{c}}{\~a}o dos
dados, aplicados na redu{\c{c}}{\~a}o dos dados para o
m{\'e}todo k-vizinhos mais pr{\'o}ximos (k nearest neighbor
k-NN), que tamb{\'e}m {\'e} um classificador supervisionado que
atua sobre os dados pr{\'o}ximos a fronteira de
separa{\c{c}}{\~a}o entre as classes. Espera-se que, com a
redu{\c{c}}{\~a}o dos dados, seja mantida a aur{\'a}cia e que
haja ganho no tempo de estimativa dos par{\^a}metros do
classificador. ABSTRACT: The Support Vector Machine classifier
(SVM), a classifier that basically uses training data near the
decision boundary is often used due to its good performance. A
disadvantage of this method is the increase training time of the
classifier as the training set size increases. The purpose of this
paper is to apply techniques to reduce the training set size
preserving the classification accuracy. The techniques used are
editing, multiediting and condensing of data, already applied in
data reduction for k-nearest neighbor method (k-NN), which is also
a classifier that operates on the data near the border separating
classes. It is expected that accuracy with reduced data sets and
there is gain in time to estimate the classifier parameters.",
conference-location = "S{\~a}o Jos{\'e} dos Campos",
conference-year = "6-8 nov. 2012",
language = "pt",
organisation = "Instituto Nacional de Pesquisas Espaciais (INPE)",
ibi = "8JMKD3MGP8W/3D85DQ8",
url = "http://urlib.net/ibi/8JMKD3MGP8W/3D85DQ8",
targetfile = "worcap2012_submission_75 - Peterson L. Sarmento.pdf",
urlaccessdate = "08 maio 2024"
}